智能论文笔记

Relevance Classification of Flood-related Twitter Posts via Multiple Transformers

Wisal Mukhtiar , Waliiya Rizwan , Aneela Habib , Yasir Saleem Afridi , Laiq Hasan , Kashif Ahmad

分类：自然语言处理

2023-01-01

In recent years, social media has been widely explored as a potential source of communication and information in disasters and emergency situations. Several interesting works and case studies of disaster analytics exploring different aspects of natural disasters have been already conducted. Along with the great potential, disaster analytics comes with several challenges mainly due to the nature of social media content. In this paper, we explore one such challenge and propose a text classification framework to deal with Twitter noisy data. More specifically, we employed several transformers both individually and in combination, so as to differentiate between relevant and non-relevant Twitter posts, achieving the highest F1-score of 0.87.

translated by 谷歌翻译

COVID-19 Classification Using Deep Learning Two-Stage Approach

Mostapha Alsaidi , Ali Saleem Altaher , Muhammad Tanveer Jan , Ahmed Altaher , Zahra Salekshahrezaee

分类：计算机视觉 | 机器学习

2022-11-28

In this paper, deep-learning-based approaches namely fine-tuning of pretrained convolutional neural networks (VGG16 and VGG19), and end-to-end training of a developed CNN model, have been used in order to classify X-Ray images into four different classes that include COVID-19, normal, opacity and pneumonia cases. A dataset containing more than 20,000 X-ray scans was retrieved from Kaggle and used in this experiment. A two-stage classification approach was implemented to be compared to the one-shot classification approach. Our hypothesis was that a two-stage model will be able to achieve better performance than a one-shot model. Our results show otherwise as VGG16 achieved 95% accuracy using one-shot approach over 5-fold of training. Future work will focus on a more robust implementation of the two-stage classification model Covid-TSC. The main improvement will be allowing data to flow from the output of stage-1 to the input of stage-2, where stage-1 and stage-2 models are VGG16 models fine-tuned on the Covid-19 dataset.

translated by 谷歌翻译

Globally Optimal Event-Based Divergence Estimation for Ventral Landing

Sofia McLeod , Gabriele Meoni , Dario Izzo , Anne Mergy , Daqi Liu , Yasir Latif , Ian Reid , Tat-Jun Chin

分类：计算机视觉

2022-09-27

事件传感是生物启发的飞行指导和控制系统中的主要组成部分。我们探讨了事件摄像机在腹侧着陆期间与表面进行时间接触（TTC）的用法。这是通过估计差异（逆TTC）的差异来实现的，即径向光流的速率，是从着陆期间产生的事件流。我们的核心贡献是针对基于事件的差异估计的一种新颖的对比度最大化公式，以及一种分支和结合算法，可准确地最大化对比度并找到最佳的差异值。进行GPU加速度以加快全球算法。另一个贡献是一个新的数据集，其中包含来自腹面着陆的真实事件流，该数据集用于测试和基准我们的方法。由于全局优化，与其他启发式差异估计器或基于事件的光流方法相比，我们的算法更有能力恢复真正的分歧。随着GPU加速，我们的方法还可以实现竞争性的运行时间。

translated by 谷歌翻译

Image Quality Assessment for Foliar Disease Identification (AgroPath)

Nisar Ahmed , Hafiz Muhammad Shahzad Asif , Gulshan Saleem , Muhammad Usman Younus

分类：计算机视觉

2022-09-26

作物疾病是对粮食安全的主要威胁，其快速识别对于防止产量损失很重要。由于缺乏必要的基础设施，因此很难迅速识别这些疾病。计算机视觉的最新进展和智能手机渗透的渗透为智能手机辅助疾病识别铺平了道路。大多数植物疾病在植物的叶面结构上留下了特定的文物。这项研究于2020年在巴基斯坦拉合尔工程技术大学计算机科学与工程系进行，以检查基于叶片的植物疾病识别。这项研究为叶面疾病鉴定提供了基于神经网络的深度解决方案，并纳入了图像质量评估，以选择执行识别所需质量的图像，并将其命名为农业病理学家（AGRO PATH）。新手摄影师的捕获图像可能包含噪音，缺乏结构和模糊，从而导致诊断失败或不准确。此外，Agropath模型具有99.42％的叶面疾病鉴定精度。拟议的添加对于在农业领域的叶面疾病鉴定的应用特别有用。

translated by 谷歌翻译

Towards Bridging the Space Domain Gap for Satellite Pose Estimation using Event Sensing

Mohsi Jawaid , Ethan Elms , Yasir Latif , Tat-Jun Chin

分类：计算机视觉 | 机器人

2022-09-24

使用合成数据训练的深层模型需要适应域的适应性，以弥合模拟环境和目标环境之间的差距。最新的域适应方法通常需要来自目标域的足够数量（未标记的）数据。但是，当目标域是极端环境（例如空间）时，这种需求很难满足。在本文中，我们的目标问题是接近卫星姿势估计，从实际的会合任务中获取卫星的图像是昂贵的。我们证明，事件传感提供了一种有希望的解决方案，可以在Stark照明差异下从模拟到目标域。我们的主要贡献是一种基于事件的卫星姿势估计技术，纯粹是对合成事件数据进行培训的，该数据具有基本数据增强，以提高针对实际（嘈杂）事件传感器的鲁棒性。基础我们的方法是一个具有仔细校准的地面真相的新型数据集，其中包括通过在剧烈的照明条件下在实验室中模拟卫星集合场景获得的真实事件数据。数据集上的结果表明，我们基于事件的卫星姿势估计方法仅在没有适应的情况下接受合成数据训练，可以有效地概括为目标域。

translated by 谷歌翻译

No Language Left Behind: Scaling Human-Centered Machine Translation

NLLB team , Marta R. Costa-jussà , James Cross , Onur Çelebi , Maha Elbayad , Kenneth Heafield , Kevin Heffernan , Elahe Kalbassi , Janice Lam , Daniel Licht

分类：自然语言处理 | 人工智能

2022-07-11

在全球范围内消除语言障碍的目标的驱动下，机器翻译已巩固自己是当今人工智能研究的关键重点。但是，这样的努力围绕着一小部分语言结合在一起，留下了绝大多数低资源的语言。在确保安全，高质量的结果的同时，在牢记道德考虑的同时，打破200个语言障碍需要什么？没有留下的语言，我们首先通过与母语人士的探索性访谈来解决对低资源语言翻译支持的必要性来应对这一挑战。然后，我们创建了旨在缩小低资源和高资源语言之间的性能差距的数据集和模型。更具体地说，我们开发了一种有条件的计算模型，基于专家的稀疏混合物，该模型经过针对针对低资源语言量身定制的新颖有效的数据挖掘技术培训的。我们提出了多次建筑和培训改进，以抵消数千个任务的培训。至关重要的是，我们使用人类翻译的基准，Flores-200评估了40,000多种不同的翻译方向的性能，并将人类评估与新型毒性基准相结合，涵盖Flores-200的所有语言，以评估翻译安全性。我们的模型相对于先前的最新技术，实现了44％BLEU的改善，为实现通用翻译系统奠定了重要的基础。最后，我们开源此工作中描述的所有贡献，可在https://github.com/facebookresearch/fairseq/tree/nllb上访问。

translated by 谷歌翻译

Traffic Congestion Prediction Using Machine Learning Techniques

Moumita Asad , Rafed Muhammad Yasir , Dr. Naushin Nower , Dr. Mohammad Shoyaib

分类：机器学习

2022-06-22

交通拥堵的预测在做出未来的决策中起着至关重要的作用。尽管已经进行了许多有关拥塞的研究，但其中大多数不能涵盖所有重要因素（例如天气条件）。我们提出了一个交通拥堵的预测模型，该模型可以根据日，时间和几个天气数据（例如温度，湿度）预测拥堵。为了评估我们的模型，已针对新德里的流量数据进行了测试。通过这种模型，可以预测一周的道路拥堵，平均RMSE为1.12。因此，该模型可用于事先采取预防措施。

translated by 谷歌翻译

Defect Prediction Using Stylistic Metrics

Rafed Muhammad Yasir , Moumita Asad , Ahmedul Kabir

分类：机器学习

2022-06-22

缺陷预测是最受欢迎的研究主题之一，因为它有可能最大程度地减少软件质量保证工作。现有方法已经从复杂性和开发者指标等各个角度检查了缺陷预测。但是，这些都没有考虑用于缺陷预测的编程样式。本文旨在分析风格指标对项目内部和交叉对象缺陷预测的影响。为了预测，使用了4种广泛使用的机器学习算法，即幼稚的贝叶斯，支持向量机，决策树和逻辑回归。该实验是在5个流行的开源项目的14个版本上进行的。检查F1，精度和召回以评估结果。结果表明，风格指标是缺陷的良好预测指标。

translated by 谷歌翻译

Enriching Abusive Language Detection with Community Context

Jana Kurrek , Haji Mohammad Saleem , Derek Ruths

分类：自然语言处理

2022-06-16

贬值表达的使用可以是良性或积极赋予能力的。当滥用检测模型将这些表达式错误分类为贬义时，它们无意中审查了边缘化群体进行的生产性对话。参与非主导观点的一种方法是添加围绕对话的上下文。先前的研究利用了用户和线程级别的功能，但它经常忽略了发生生产性对话的空间。我们的论文强调了社区环境如何改善滥用语言检测的分类结果。我们为此做出了两个主要贡献。首先，我们证明，在线社区以他们对虐待受害者的支持的性质聚集。其次，我们确定社区环境如何提高准确性并降低最先进的滥用语言分类器的假阳性率。这些发现暗示了在滥用语言研究中的上下文感知模型的有希望的方向。

translated by 谷歌翻译

Text Mining Through Label Induction Grouping Algorithm Based Method

Gulshan Saleem , Nisar Ahmed , Usman Qamar

分类：人工智能

2021-12-15

信息检索方法的主要焦点是提供准确有效的结果，这也具有成本效益。 Lingo（标签感应分组算法）是一种聚类算法，旨在为质量集群的形式提供搜索结果，但也有一些限制。在本文中，我们的重点是基于实现更有意义和提高算法的整体性能的结果。灵戈在两个主要步骤上工作;使用潜在语义索引技术（LSI）和群集内容发现通过使用矢量空间模型（VSM）来群集标签诱导。由于Lingo使用群集内容发现中的VSM，我们的任务是用LSI替换VSM以进行群集内容发现，并分析使用LSI与OTHAPI BM25的可行性。下一个任务是将修改方法的结果与Lingo原始方法进行比较。该研究应用于五种不同的基于文本的数据集，以获得每个方法的更可靠的结果。研究结果表明，当使用LSI进行内容发现时，Lingo产生40-50％的结果。从使用OKAPI BM25的理论证据进行评分方法在LSI（LSI + OKAPI BM25）中用于群集内容发现而不是VSM，也导致更好的群集在缩放性和性能方面产生，当比较VSM和LSI的结果时。

translated by 谷歌翻译